ABSTRACT The definition of Topic as well as that of information structure in the literature is very broad (cf. BARBOSA, 2005; MELLO; SILVA, 2015). Here we assume the definition as proposed by the Language into Act Theory (CRESTI, 2000), which says that Topic is the textual unit that is performed by an intonational profile of the prefix type (‘t HART et al. 1990), and that has the function of constituting the domain over which the illocutionary force applies. An NP in Topic either can be the subject of the following verb in Comment or an anacoluthon. Anacolutha NPs are phrases that bear no syntactic relations with the predication in Comment. In this paper, we show how NPs are distributed probabilistically between these two conditions when they are performed as Topics in spontaneous speech. For this purpose, we collected data from available spontaneous speech corpora informationally labeled - including the Topic unit as defined above - from three languages: European Spanish (NICOLÁS MARTÍNEZ; LOMBÁN SOMACARRERA, 2018), American English (CAVALCANTE; RAMOS, 2016), and Brazilian Portuguese (PANUNZI; GREGORI; MITTMANN, 2014). The statistical method used to calculate the probability was a mixed-effects logistic regression with crossed random effects conducted with the aid of R (R CORE TEAM, 2018). Three variables were chosen: accessibility of referent, animacy, and definiteness. The model showed that there are about five times more chances for an NP performed in Topic to be the subject of the verb in Comment if it is animate, definite, and given.
RESUMO A literatura apresenta muitas definições acerca da noção de Tópico e de estrutura informacional (cf. BARBOSA, 2005; MELLO; SILVA, 2015). Neste trabalho, assume-se a definição da Language into Act Theory (CRESTI, 2000) que diz que o Tópico é a porção textual que se realiza por meio de um padrão entoacional do tipo prefix (‘t HART et al. 1990) e que tem por função constituir o domínio sobre o qual a força ilocucionária se aplica. Um SN em Tópico pode ser o sujeito do verbo no Comentário ou um anacoluto. SNs anacolutos são sintagmas que não possuem relação sintática com o conteúdo presente no Comentário. Neste trabalho, mostra-se como SNs estão distribuídos probabilisticamente entre essas duas condições quando são realizados como Tópico na fala espontânea. Para isso, foram coletados dados de corpora de fala espontânea etiquetados informacionalmente - incluindo a unidade de Tópico conforme definida acima - de três línguas: espanhol europeu (NICOLÁS MARTÍNEZ; LOMBÁN SOMACARRERA, 2018), inglês americano (CAVALCANTE; RAMOS, 2016) e português brasileiro (PANUNZI; MITTMANN, 2014). O método estatístico utilizado para o cálculo da probabilidade foi um modelo misto de regressão logística com efeitos aleatórios cruzados, conduzido com auxílio do R (R CORE TEAM, 2018). Três variáveis foram selecionadas para o cálculo: acessibilidade do referente, animacidade e definitude. O modelo mostrou que há cerca de cinco vezes mais chances de que o SN realizado em Tópico seja sujeito do verbo no Comentário caso ele seja animado, definido e seja classificado como informação dada no discurso.